تشخیص احساس ازسیگنال گفتار با استفاده از موجک بیونیک

نویسندگان

رسول یوسفی نزاد

سازمان صدا سیما بابک حاجی باقر نایینی

دانشگاه صداوسیما تهران-مدیر گروه ict معصومه شفیعیان

دانشگاه صدا وسیما تهران-عضو هییت علمی گروه مهندسی صدا

چکیده

تشخیص احساس برای رایانه امری چالش برانگیز است. دلیل اصلی این موضوع نیز عدم توانایی رایانه در درک احساس کاربر است. هدف از این مقاله، طراحی یک سیستم تشخیص احساس از گفتار و ارائه روشی نوین جهت بهبود این سیستم است. تاکنون در این زمینه از ویژگی های متفاوتی استفاده شده است، اما هیچ یک عملاً به ارتباط بین دامنه صوت و حالت های احساسی نپرداخته اند. چون موجک بیونیک به این ارتباط بیشتر پرداخته است، به نظر می رسد بتواند در جداسازی حالت های مختلف احساسی کمک کند. برای این منظور، در این پژوهش از موجک بیونیک برای استخراج ویژگی از سیگنال های صوتی، در تشخیص خودکار احساسات از گفتار استفاده شده است. ساختارموجک بیونیک منطبق بر ساختار گوش انسان است و چون انسان درک خوبی از احساسات گفتار دارد، می توان انتظار داشت که استفاده از موجک بیونیک برای تشخیص خودکار احساسات از گفتار مفید باشد. ساختار پیشنهادی روی پایگاه داده های برلین و دادگان گفتار احساسی فارسی ارزیابی شده است، که این دادگان شامل عبارات و جملاتی کوتاه و بیانگر احساسات منفی ترس، خشم، ناراحتی و حالت طبیعی و جز این ها هستند. نتایج آزمایش ها نشان می دهد الگوریتم پیشنهادی عملکرد قابل قبولی در مقایسه با سیستم های تشخیص خودکار احساسات از گفتار موجود ارائه می دهد.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بهبود نرخ تشخیص احساس از روی گفتار با استفاده از تفکیک جنسیتی

تشخیص احساس از روی سیگنال گفتار یکی از شاخه‌های نسبتاً جدید در پردازش گفتار می‌باشد که می‌تواند در تعامل انسان و روبات نقش مهمی ایفا کند. در این مقاله ضمن استفاده از دو نوع ویژگی طیفی جدید به منظور افزایش نرخ بازشناسی به بررسی تاثیر جنسیت گویندگان در تشخیص احساس پرداخته شده است. ویژگی‌های یاد شده با استفاده از روش‌های پردازش تصویر، از تصویر طیف‌نگاره سیگنال گفتار استخراج می‌شوند . در این تحقیق ب...

متن کامل

تشخیص حالت احساسی از سیگنال گفتار در حالت مستقل از گوینده با استفاده از آنتروپی بسته موجک

در این مقاله آنتروپی بسته موجک برای بازشناسی احساسات از گفتار در حالت مستقل از گوینده پیشنهاد شده است. پس از پیش‌پردازش، بسته موجکِ db3 سطح 4 در هر فریم محاسبه شده است و آنتروپی شانون در گره‌های آن به عنوان ویژگی در نظر گرفته شده است. ضمناً ویژگی‌های نواییِ گفتار شامل فرکانس چهار فرمنت اول، جیتر یا دامنه تغییرات فرکانس گام و شیمر یا دامنه تغییرات انرژی به عنوان ویژگی‌های پرکاربرد در حوزه تشخیص احس...

متن کامل

تشخیص حالت احساسی از سیگنال گفتار در حالت مستقل از گوینده با استفاده از آنتروپی بسته موجک

در این مقاله آنتروپی بسته موجک برای بازشناسی احساسات از گفتار در حالت مستقل از گوینده پیشنهاد شده است. پس از پیش‌پردازش، بسته موجکِ db3 سطح 4 در هر فریم محاسبه شده است و آنتروپی شانون در گره‌های آن به عنوان ویژگی در نظر گرفته شده است. ضمناً ویژگی‌های نواییِ گفتار شامل فرکانس چهار فرمنت اول، جیتر یا دامنه تغییرات فرکانس گام و شیمر یا دامنه تغییرات انرژی به عنوان ویژگی‌های پرکاربرد در حوزه تشخیص احس...

متن کامل

تشخیص منبع های گرانی با استفاده از تبدیل موجک پیوسته

امروزه از تبدیل موجک، به صورت گسترده‌ای در پردازش و تفسیر داده‌های ژئوفیزیکی، مخصوصاً داده‌های لرزه‌ای، استفاده می‌شود اما این روش هنوز در تفسیر داده‌های گرانی و ژئومغناطیس کاربرد رایجی نیافته است. در این مقاله سعی شده است روشی جدید بر پایه نظری تبدیل موجک پیوسته برای تعیین موقعیت و عمق ناهنجاری‌های گرانی ارائه شود. موجک مورد استفاده در تبدیل موجک پیوسته در روش پیش‌گفته اساس مشتق‌های افقی چشمه‌ا...

متن کامل

تشخیص حالت احساسی از سیگنال گفتار در حالت مستقل از گوینده با استفاده از آنتروپی بسته موجک

در این مقاله آنتروپی بسته موجک برای بازشناسی احساسات از گفتار در حالت مستقل از گوینده پیشنهاد شده است. پس از پیش پردازش، بسته موجکِ db3 سطح 4 در هر فریم محاسبه شده است و آنتروپی شانون در گره های آن به عنوان ویژگی در نظر گرفته شده است. ضمناً ویژگی های نواییِ گفتار شامل فرکانس چهار فرمنت اول، جیتر یا دامنه تغییرات فرکانس گام و شیمر یا دامنه تغییرات انرژی به عنوان ویژگی های پرکاربرد در حوزه تشخیص احس...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
صوت و ارتعاش

جلد ۵، شماره ۹، صفحات ۷۱-۸۳

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023